Tujuan dari analisis data ini adalah untuk mengeksplorasi dan memahami pola serta hubungan antar variabel dalam dataset. Visualisasi digunakan untuk menggambarkan distribusi data dan pola yang mungkin tidak terlihat hanya dengan tabel.
Membaca Data
# Membaca Data
library(readxl)
Data <- read_excel("Data.xlsx")
View(Data)
Penjelasan:
library(readxl) memuat pustaka untuk membaca file
Excel.read_excel("Data.xlsx") membaca file Excel “Data.xlsx”
dan menyimpannya dalam variabel Data.View(Data) menampilkan data yang dibaca dalam tampilan
visual di RStudio.Histogram untuk Pendapatan_per_kapita
# Memuat library
library(ggplot2)
# Membuat histogram untuk Pendapatan_per_kapita
ggplot(Data, aes(x = Pendapatan_per_kapita)) +
geom_histogram(colour= "lightblue", fill = "pink", size = 1, line = ".") +
labs(title = "Distribusi Pendapatan per Kapita", x = "Pendapatan per Kapita", y = "Frekuensi") +
theme_classic()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning in geom_histogram(colour = "lightblue", fill = "pink", size = 1, :
## Ignoring unknown parameters: `line`
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Tahapan pembuatan grafik:
1. Memuat Library
Memuat pustaka ggplot2 yang digunakan untuk visualisasi data di R.
library(ggplot2)
2. Membuat Histogram
Histogram digunakan untuk menampilkan distribusi data dari satu
variabel numerik, dalam hal ini Pendapatan_per_kapita.
Pada tahap ini, kita mendefinisikan grafik menggunakan fungsi
ggplot(), memilih variabel yang akan dianalisis, dan
menentukan jenis grafik yang akan digunakan, yaitu
geom_histogram().
aes(x = Pendapatan_per_kapita): Menentukan bahwa
sumbu X akan berisi data
Pendapatan_per_kapita.
geom_histogram(): Membuat histogram dengan garis
luar berwarna biru muda (lightblue) dan isi histogram berwarna merah
muda (pink).
3. Menambahkan Judul dan Label Sumbu
Untuk memberikan konteks yang lebih jelas pada grafik, kita
menambahkan judul dan label pada sumbu X dan Y menggunakan fungsi
labs().
title: Memberikan judul yang informatif pada grafik,
dalam hal ini, “Distribusi Pendapatan per Kapita”.
x dan y: Memberikan label yang jelas
pada sumbu X dan Y, yang membantu pembaca memahami variabel apa yang
ditampilkan di masing-masing sumbu.
4. Menambahkan Tema
Untuk tampilan yang lebih bersih dan sederhana, kita menggunakan tema
theme_classic(), yang memberikan latar belakang putih dan
garis sumbu yang jelas.
5. Interpretasi Grafik
Grafik ini menggambarkan distribusi Pendapatan per Kapita dari data yang ada. Berdasarkan histogram yang ditampilkan, kita bisa melihat sebaran frekuensi dari berbagai rentang pendapatan per kapita. Misalnya, jika sebagian besar data terkonsentrasi di sisi kiri grafik, itu menunjukkan bahwa sebagian besar individu atau entitas dalam dataset memiliki pendapatan per kapita yang lebih rendah. Sebaliknya, jika data lebih terkonsentrasi di sisi kanan, itu menunjukkan adanya pendapatan yang lebih tinggi.
Scatter plot antara Angka_Harapan_Hidup dan Pendapatan_per_kapita
# Memuat library
library(ggplot2)
# Membuat scatter plot antara Angka_Harapan_Hidup dan Pendapatan_per_kapita
ggplot(Data, aes(x = Pendapatan_per_kapita, y = Angka_Harapan_Hidup)) +
geom_point(colour = "lightblue", alpha = 0.5) +
labs(title = "Hubungan Antara Pendapatan per Kapita dan Angka Harapan Hidup",
x = "Pendapatan per Kapita", y = "Angka Harapan Hidup") +
theme_classic()
Tahapan pembuatan grafik:
1. Memuat Library
Memuat pustaka ggplot2 yang digunakan untuk visualisasi data di R.
library(ggplot2)
2. Membuat Scatter Plot
Scatter plot digunakan untuk menampilkan hubungan antara dua variabel
numerik, dalam hal ini Pendapatan_per_kapita dan
Angka_Harapan_Hidup. Pada tahap ini, kita
mendefinisikan grafik menggunakan fungsi ggplot(), memilih
variabel yang akan dianalisis, dan menentukan jenis grafik yang akan
digunakan, yaitu geom_point().
aes(x = Pendapatan_per_kapita, y = Angka_Harapan_Hidup):
Menentukan bahwa sumbu X akan berisi data
Pendapatan_per_kapita dan sumbu Y akan berisi data
Angka_Harapan_Hidup.
geom_point(): Membuat scatter plot dengan titik data
yang diberi warna biru muda (lightblue) dan tingkat transparansi (alpha)
0.5 untuk memberikan efek visual yang lebih halus.
3. Menambahkan Judul dan Label Sumbu
Untuk memberikan konteks yang lebih jelas pada grafik, kita
menambahkan judul dan label pada sumbu X dan Y menggunakan fungsi
labs().
title: Memberikan judul yang informatif pada grafik,
dalam hal ini, “Hubungan Antara Pendapatan per Kapita dan Angka Harapan
Hidup”.
x dan y: Memberikan label yang jelas
pada sumbu X dan Y, yang membantu pembaca memahami variabel apa yang
ditampilkan di masing-masing sumbu.
4. Menambahkan Tema
Untuk tampilan yang lebih bersih dan sederhana, kita menggunakan tema
theme_classic(), yang memberikan latar belakang putih dan
garis sumbu yang jelas.
5. Interpretasi Grafik
Grafik ini menggambarkan hubungan antara Pendapatan per Kapita dan Angka Harapan Hidup. Berdasarkan scatter plot yang ditampilkan, kita bisa melihat apakah ada korelasi antara kedua variabel tersebut. Misalnya, jika titik-titik data cenderung membentuk garis naik (positif), itu menunjukkan bahwa semakin tinggi pendapatan per kapita, semakin tinggi angka harapan hidup. Sebaliknya, jika tidak ada pola yang jelas atau jika titik-titik tersebar tanpa hubungan yang jelas, itu menunjukkan bahwa tidak ada korelasi yang kuat antara kedua variabel tersebut.
Bar chart untuk Rata-rata Pendapatan per Kapita berdasarkan Benua
# Memuat library
library(ggplot2)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
# Menghitung rata-rata Pendapatan per Kapita berdasarkan Benua
data_summary <- Data %>%
group_by(Benua) %>%
summarise(mean_pendapatan = mean(Pendapatan_per_kapita, na.rm = TRUE))
# Membuat bar chart untuk rata-rata Pendapatan per Kapita berdasarkan Benua
ggplot(data_summary, aes(x = Benua, y = mean_pendapatan, fill = Benua)) +
geom_bar(stat = "identity") +
labs(title = "Rata-rata Pendapatan per Kapita berdasarkan Benua",
x = "Benua", y = "Rata-rata Pendapatan per Kapita") +
theme_classic() +
theme(legend.position = "none") +
scale_fill_manual(values = c("asia" = "lightblue", "africa" = "lightgreen", "europe" = "pink", "americas" = "purple"))
Tahapan pembuatan grafik:
1. Memuat Library
library(ggplot2): Memuat pustaka
ggplot2, yang digunakan untuk membuat grafik.
library(dplyr): Memuat pustaka
dplyr, yang digunakan untuk manipulasi data seperti
perhitungan rata-rata.
library(ggplot2)
library(dplyr)
2. Menghitung Rata-rata Pendapatan per Kapita berdasarkan Benua
Data %>%: Menggunakan operator pipe
(%>%) untuk memproses data secara berurutan.
group_by(Benua): Mengelompokkan data berdasarkan
kolom Benua.
summarise(mean_pendapatan = mean(Pendapatan_per_kapita, na.rm = TRUE)):
Menghitung rata-rata Pendapatan per Kapita untuk setiap
kelompok Benua. na.rm = TRUE berarti data
yang kosong (NA) akan diabaikan dalam perhitungan rata-rata.
3. Membuat Bar Chart
`ggplot(data_summary, aes(...)): Membuat plot dengan
data yang telah dihitung rata-ratanya (data_summary).
x = Benua: Sumbu X diisi dengan variabel
Benua.
y = mean_pendapatan: Sumbu Y diisi dengan nilai
rata-rata pendapatan per kapita.
fill = Benua: Mewarnai batang berdasarkan
Benua.
geom_bar(stat = "identity"): Membuat grafik
bar chart menggunakan nilai yang sudah dihitung (bukan
hitungan frekuensi).
labs(...): Menambahkan judul grafik dan label untuk
sumbu X dan Y.
theme_classic(): Menambahkan tema klasik dengan
latar belakang putih dan garis sumbu yang jelas.
theme(legend.position = "none"): Menghilangkan
legenda (karena sudah tercermin dalam warna batang).
scale_fill_manual(...): Menetapkan warna khusus
untuk setiap Benua:
Asia: lightblue
Afrika: lightgreen
Eropa: pink
Amerika: purple
4. Interpretasi Grafik
Grafik ini menunjukkan rata-rata Pendapatan per Kapita untuk setiap Benua. Setiap batang menggambarkan nilai rata-rata pendapatan untuk benua tertentu, dengan warna yang berbeda untuk setiap benua. Dengan melihat grafik ini, kita dapat membandingkan seberapa besar rata-rata pendapatan per kapita antar benua.
Heatmap antara Pendapatan per kapita, Populasi, dan Angka Harapan Hidup
# Memuat library
library(ggplot2)
# Membuat heatmap antara Pendapatan_per_kapita, Populasi, dan Angka_Harapan_Hidup
ggplot(Data, aes(x = Pendapatan_per_kapita, y = Populasi, fill = Angka_Harapan_Hidup)) +
geom_tile() +
scale_fill_gradient(low = "lightgreen", high = "purple") +
labs(title = "Heatmap: Pendapatan per Kapita, Populasi, dan Angka Harapan Hidup",
x = "Pendapatan per Kapita", y = "Populasi", fill = "Angka Harapan Hidup") +
theme_classic()
Tahapan pembuatan grafik:
1. Memuat Library
Memuat pustaka ggplot2 yang digunakan untuk visualisasi data di R.
library(ggplot2)
2. Membuat Heatmap
ggplot(Data, aes(x = Pendapatan_per_kapita, y = Populasi, fill = Angka_Harapan_Hidup)):
Mengonfigurasi data yang akan digunakan untuk grafik, yaitu Pendapatan
per Kapita pada sumbu X, Populasi pada sumbu Y, dan Angka Harapan Hidup
sebagai variabel yang digunakan untuk mengisi warna (fill)
tile.
geom_tile(): Fungsi untuk membuat grafik heatmap, di
mana setiap kombinasi nilai Pendapatan per Kapita dan Populasi diwakili
oleh sebuah kotak (tile) yang warnanya dipengaruhi oleh nilai Angka
Harapan Hidup.
scale_fill_gradient(low = "lightgreen", high = "purple"):
Menentukan gradasi warna, dengan warna hijau muda untuk nilai Angka
Harapan Hidup yang rendah dan ungu untuk nilai yang tinggi.
labs(): Menambahkan judul dan label pada sumbu X dan
Y, serta label untuk warna (fill), memberikan konteks tambahan pada
grafik.
theme_classic(): Menambahkan tema klasik untuk
tampilan yang lebih bersih dan sederhana.
3. Interpretasi Grafik
Grafik ini menunjukkan hubungan antara Pendapatan per Kapita, Populasi, dan Angka Harapan Hidup. Warna pada heatmap menggambarkan nilai Angka Harapan Hidup, dengan warna hijau muda menunjukkan angka harapan hidup rendah dan ungu menunjukkan angka harapan hidup tinggi. Dapat dilihat apakah ada pola antara ketiga variabel tersebut, seperti apakah negara dengan pendapatan lebih tinggi cenderung memiliki angka harapan hidup yang lebih tinggi.
3D scatter plot dengan Angka Harapan Hidup, Pendapatan per kapita, dan Populasi
# Memuat library
library(plotly)
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
# Membuat 3D scatter plot dengan Angka_Harapan_Hidup, Pendapatan_per_kapita, dan Populasi
plot_ly(Data,
x = ~Pendapatan_per_kapita,
y = ~Angka_Harapan_Hidup,
z = ~Populasi, # bisa diganti dengan variabel lain, misal Jumlah_Anak
type = "scatter3d",
mode = "markers",
color = ~Benua, # Warna berdasarkan benua
colors = c('lightgreen', 'purple', 'lightblue', 'pink'), # Menentukan warna
marker = list(size = 5)) %>%
layout(title = "3D Scatter Plot: Pendapatan per Kapita, Angka Harapan Hidup, dan Populasi",
scene = list(
xaxis = list(title = "Pendapatan per Kapita"),
yaxis = list(title = "Angka Harapan Hidup"),
zaxis = list(title = "Populasi")
))
Tahapan pembuatan grafik:
1. Memuat Library
Memuat pustaka plotly, yang digunakan untuk membuat grafik interaktif, termasuk 3D scatter plot.
library(plotly)
2. Membuat 3D Scatter Plot
x = ~Pendapatan_per_kapita, y = ~Angka_Harapan_Hidup, z = ~Populasi:
Mengatur variabel pada sumbu X, Y, dan Z untuk grafik 3D.
type = "scatter3d": Menggunakan tipe
scatter3d untuk membuat grafik 3D.
mode = "markers": Menampilkan titik data (marker) di
grafik.
color = ~Benua: Pewarnaan titik berdasarkan
Benua untuk membedakan negara atau wilayah.
colors = c('lightgreen', 'purple', 'lightblue', 'pink'):
Menentukan warna untuk masing-masing benua.
marker = list(size = 5): Mengatur ukuran titik
data.
layout(): Menambahkan judul dan label pada sumbu X,
Y, dan Z untuk memberikan konteks.
3. Menambahkan Layout dan Pengaturan Sumbu
layout() digunakan untuk menyesuaikan tampilan plot,
seperti menambahkan judul, pengaturan sumbu, dan elemen desain
lainnya.
title = "3D Scatter Plot: Pendapatan per Kapita, Angka Harapan Hidup, dan Populasi":
Menentukan judul grafik, yang memberikan informasi
mengenai isi grafik.
xaxis = list(title = "Pendapatan per Kapita"):
Menentukan label untuk sumbu X, yang
menunjukkan variabel *Pendapatan per Kapita.
yaxis = list(title = "Angka Harapan Hidup"):
Menentukan label untuk sumbu Y, yang menunjukkan
variabel Angka Harapan Hidup.
zaxis = list(title = "Populasi"): Menentukan
label untuk sumbu Z, yang menunjukkan variabel
Populasi.
4. Interpretasi Grafik
Grafik ini menunjukkan hubungan antara Pendapatan per Kapita, Angka Harapan Hidup, dan Populasi dalam format 3D. Titik data yang diwarnai berdasarkan Benua memberikan visualisasi interaktif yang memudahkan untuk melihat distribusi data pada ketiga variabel ini, serta membandingkan bagaimana masing-masing benua tersebar pada dimensi tersebut.
###plotly plotly scatter plot
# Memuat library plotly
library(plotly)
# Membuat plotly scatter plot
fig <- plot_ly(Data, x = ~Pendapatan_per_kapita, y = ~Angka_Harapan_Hidup,
type = 'scatter', mode = 'markers',
marker = list(color = 'rgba(255, 182, 193, .9)', size = 5)) %>%
layout(title = "Scatter Plot Interaktif: Pendapatan per Kapita vs Angka Harapan Hidup",
xaxis = list(title = "Pendapatan per Kapita"),
yaxis = list(title = "Angka Harapan Hidup"))
# Menampilkan plot
fig
Tahapan pembuatan grafik:
1. Memuat Library
Memuat pustaka Plotly yang digunakan untuk membuat visualisasi interaktif di R. Plotly memungkinkan kita membuat grafik yang bisa diinteraksikan, seperti zooming, hover info, dan lainnya.
library(plotly)
2. Membuat Scatter Plot
plot_ly() adalah fungsi utama dari Plotly untuk
membuat grafik. Di sini, `plot_ly() digunakan untuk membuat
scatter plot dengan data yang diambil dari variabel
Data.
Data: Ini adalah data frame yang berisi
variabel-variabel yang ingin dipetakan ke grafik.
x = ~Pendapatan_per_kapita: Menentukan bahwa sumbu X
akan menampilkan data dari variabel
Pendapatan_per_kapita.
y = ~Angka_Harapan_Hidup: Menentukan bahwa sumbu Y
akan menampilkan data dari variabel
Angka_Harapan_Hidup.
type = 'scatter': Menentukan jenis grafik yang
digunakan adalah scatter plot, yang menggambarkan hubungan dua
variabel.
mode = 'markers': Menggunakan mode
‘markers’ yang berarti setiap data poin akan
digambarkan sebagai titik-titik (bukan garis).
marker = list(color = 'rgba(255, 182, 193, .9)', size = 5):
Menentukan gaya visual dari titik data. Di sini, titik data akan
memiliki warna pink muda
(rgba(255, 182, 193, .9)) dan ukuran
5.
3. Menambahkan Layout dan Pengaturan Sumbu
layout() digunakan untuk menyesuaikan tampilan plot,
seperti judul dan label sumbu.
title = "Scatter Plot Interaktif: Pendapatan per Kapita vs Angka Harapan Hidup":
Menentukan judul grafik.
xaxis = list(title = "Pendapatan per Kapita"):
Menentukan label untuk sumbu X.
yaxis = list(title = "Angka Harapan Hidup"):
Menentukan label untuk sumbu Y.
4. Menampilkan Grafik
Di sini, fig adalah objek yang menyimpan plot yang sudah
dibuat. Dengan mengetikkan fig atau menggunakan fungsi
print(), plot tersebut akan ditampilkan di output.
5. Interpretasi Grafik
Grafik ini menunjukkan hubungan antara Pendapatan per Kapita dan Angka Harapan Hidup. Titik data menggambarkan negara atau entitas, dengan sumbu X menunjukkan pendapatan dan sumbu Y menunjukkan angka harapan hidup. Secara umum, negara dengan pendapatan lebih tinggi cenderung memiliki angka harapan hidup yang lebih tinggi. Grafik ini interaktif, memungkinkan zoom dan hover untuk melihat nilai spesifik dari setiap titik.
1. Distribusi Pendapatan per Kapita
Histogram menunjukkan bahwa mayoritas data terpusat pada pendapatan per kapita yang lebih rendah, dengan hanya sedikit data pada kisaran pendapatan lebih tinggi, mengindikasikan bahwa banyak negara dalam dataset memiliki pendapatan rendah.
2. Hubungan antara Pendapatan per Kapita dan Angka Harapan Hidup
Scatter plot menunjukkan kecenderungan positif antara pendapatan per kapita dan angka harapan hidup, dimana negara dengan pendapatan lebih tinggi umumnya memiliki angka harapan hidup yang lebih tinggi.
3. Rata-rata Pendapatan per Kapita Berdasarkan Benua
Bar chart memperlihatkan bahwa Eropa dan Amerika memiliki rata-rata pendapatan per kapita yang jauh lebih tinggi dibandingkan dengan Asia dan Afrika, menunjukkan ketimpangan ekonomi antar benua.
4. Hubungan antara Pendapatan per Kapita, Populasi, dan Angka Harapan Hidup
Heatmap menunjukkan bahwa negara dengan pendapatan per kapita yang lebih tinggi cenderung memiliki angka harapan hidup yang lebih baik, meskipun populasi yang lebih besar tidak selalu berhubungan dengan peningkatan angka harapan hidup.
5. 3D Scatter Plot
Grafik 3D menggambarkan hubungan yang kompleks antara Pendapatan per Kapita, Angka Harapan Hidup, dan Populasi, dengan negara berpendapatan tinggi cenderung memiliki angka harapan hidup yang lebih baik.
6. Grafik Interaktif
Scatter plot interaktif memungkinkan eksplorasi lebih lanjut dan pemahaman yang lebih baik mengenai hubungan antara Pendapatan per Kapita dan Angka Harapan Hidup dengan fitur interaktif seperti zooming dan hover info.